Che khuất là gì? Các bài báo nghiên cứu khoa học liên quan

Che khuất (occlusion) là hiện tượng khi một vật thể hoặc phần của nó bị vật cản chắn lấp, khiến một phần hoặc toàn bộ đối tượng nằm sau không thể quan sát. Trong thị giác sinh học và máy tính, xử lý che khuất giúp xác định mối quan hệ tiền cảnh–hậu cảnh và hỗ trợ nhận diện, theo dõi đối tượng trong cảnh 3D.

Định nghĩa và khái niệm cơ bản

Che khuất (occlusion) là hiện tượng trong trường nhìn khi một vật thể hoặc phần của vật thể này bị vật cản khác chắn mất, không thể quan sát hoặc chỉ quan sát được một phần. Hiện tượng này xảy ra tự nhiên trong môi trường 3D, khi các đối tượng có vị trí sâu khác nhau so với góc nhìn của người quan sát hoặc cảm biến.

Trong thị giác sinh học, che khuất giúp não bộ xác định mối quan hệ về độ sâu và vị trí tương đối của các vật thể, hình thành nhận thức tiền cảnh – hậu cảnh (foreground – background). Khi một vật A che khuất một phần của vật B, não sẽ hiểu rằng A nằm gần hơn B.

Trong thị giác máy tính và đồ họa máy tính, xử lý che khuất (occlusion handling) là kỹ thuật cần thiết để xác định phần nào của cảnh quan cần được vẽ, phần nào cần bị bỏ qua để tối ưu hóa tài nguyên tính toán và đảm bảo kết quả hình ảnh trung thực.

Phân loại che khuất

Che khuất có thể được phân thành ba loại chính dựa trên mối quan hệ giữa vật thể và vật cản:

  • Self-occlusion: Một phần của vật thể che khuất chính nó. Ví dụ, cánh tay che khuất thân người khi nâng lên ngang ngực.
  • Inter-occlusion: Vật thể này che khuất một phần hoặc toàn bộ vật thể khác. Ví dụ, một chiếc ô tô chắn trước mặt một chiếc xe khác.
  • Background occlusion: Vật cản không phải đối tượng chính che lấp đối tượng cần quan sát. Ví dụ, cây cỏ che khuất tòa nhà phía sau.

Mỗi loại che khuất đặt ra những thách thức khác nhau trong việc xác định chiều sâu (depth) và tái tạo hình ảnh hoàn chỉnh. Self-occlusion thường gây khó khăn cho việc nhận dạng hình dáng, trong khi inter-occlusion và background occlusion ảnh hưởng đến phân khúc (segmentation) và theo dõi (tracking).

Mô hình hình học và toán học của che khuất

Trong hình học máy tính, che khuất được mô hình hóa thông qua bản đồ chiều sâu (depth map) hoặc bản đồ ẩn (visibility map). Với mỗi pixel (x, y) trong hình ảnh, ta lưu giá trị độ sâu Z(x,y). Khi hai vật thể cùng chiếu lên một pixel, vật thể có giá trị Z nhỏ hơn (gần hơn camera) sẽ che khuất vật thể xa hơn:

Zfore(x,y)<Zback(x,y)Z_{\text{fore}}(x,y) < Z_{\text{back}}(x,y)

Hệ phương trình ray-casting xác định giao điểm giữa tia nhìn (ray) xuất phát từ camera và bề mặt vật thể trong không gian 3D. Với mỗi tia:

ray(t)=o+td,t>0\text{ray}(t) = \mathbf{o} + t\mathbf{d},\quad t>0

trong đó \(\mathbf{o}\) là gốc tia, \(\mathbf{d}\) là hướng, và \(t\) là thông số khoảng cách. Giao điểm nhỏ nhất (t_min) cho biết vật thể che khuất đầu tiên:

tmin=min{ti:intersection(ray,Si)}t_{\min} = \min\{t_i : \text{intersection}(\text{ray}, S_i)\}

Với \(S_i\) là bề mặt của vật thể i. Cơ chế này là nền tảng cho thuật toán z-buffer trong đồ họa máy tính, lưu trữ giá trị \(t_{\min}\) cho mỗi pixel để so sánh và quyết định pixel nào được hiển thị.

Thành phầnCông dụng
Depth map (Z-buffer)Lưu độ sâu gần nhất cho từng pixel
Ray-castingTính giao điểm tia nhìn – bề mặt vật thể
Visibility mapXác định pixel có thể nhìn thấy

Phương pháp phát hiện che khuất

Phát hiện che khuất trong hình ảnh có thể sử dụng nhiều kỹ thuật:

  • Stereo matching: So sánh hai ảnh từ hai camera lệch nhau, vùng mất tương quan (disparity holes) cho biết pixel bị che khuất (OpenCV).
  • Depth sensor (RGB-D): Cảm biến như Kinect hoặc RealSense cho bản đồ độ sâu trực tiếp, pixel không có giá trị hoặc giá trị vô cùng lớn được xem là che khuất.
  • CNN-based segmentation: Mạng nơ-ron sâu phân khúc foreground/background, học đặc trưng che khuất từ dữ liệu có chú thích (CVPR).

Kết hợp thông tin màu sắc, gradient, texture và chiều sâu giúp cải thiện độ chính xác phát hiện vùng che khuất. Ví dụ, thuật toán bên OpenCV kết hợp stereo và optical flow để xử lý che khuất động trong video.

Ảnh hưởng tới thị giác máy tính

Che khuất làm giảm độ chính xác trong các bài toán nhận dạng và theo dõi đối tượng. Khi một phần hoặc toàn bộ vật thể bị che khuất, các đặc trưng hình học và màu sắc quan trọng không thể thu nhận đầy đủ, dẫn đến sai lệch trong bước phân đoạn (segmentation) và nhận diện (recognition).

Trong theo dõi chuyển động (tracking), che khuất tạm thời (temporary occlusion) khiến thuật toán mất dấu vật thể hoặc nhầm lẫn với đối tượng khác. Các phương pháp dựa trên bounding box thường thất bại khi che khuất quá 50 % diện tích vật thể, trong khi các kỹ thuật dựa trên điểm đặc trưng (feature-based) có thể duy trì theo dõi nếu đủ điểm không bị che.

  • Giảm độ tin cậy trong nhận dạng khuôn mặt và biển số phương tiện.
  • Thất bại trong theo dõi đa đối tượng khi che khuất chéo giữa các vật thể.
  • Gia tăng tỷ lệ false positive/false negative do mất mát thông tin đặc trưng.

Kỹ thuật khôi phục thông tin che khuất

Inpainting là phương pháp phổ biến để khôi phục vùng ảnh bị che khuất hoặc hỏng. Thuật toán inpainting lan truyền thông tin từ vùng lân cận dựa trên texture và cấu trúc biên, tái tạo pixel mất mát một cách tự nhiên (IEEE T-PAMI).

Đối với dữ liệu 3D hoặc đa góc (multi-view), kỹ thuật tái tạo bề mặt (surface reconstruction) và stereo fusion kết hợp nhiều hình ảnh khác nhau để lấp đầy vùng che. Thuật toán Poisson reconstruction và volumetric fusion thường dùng trong các bộ KITTI và Middlebury (Middlebury).

Phương phápƯu điểmNhược điểm
Inpainting textureNhanh, hiệu quả với vùng nhỏKém tự nhiên với vùng lớn
Multi-view fusionChính xác cao, giữ chi tiết 3DYêu cầu nhiều góc chụp, tốn kém
GAN-based synthesisMẫu sinh phong phú, tự nhiênKhó đào tạo, có thể sinh artifact

Ứng dụng trong đồ họa máy tính và thực tế ảo

Trong đồ họa, xử lý che khuất tối ưu hóa quá trình render bằng thuật toán z-buffer, chỉ vẽ pixel không bị che. Kỹ thuật culling và occlusion queries trong OpenGL/DirectX loại bỏ những đối tượng nằm sau bề mặt, giảm đáng kể khối lượng tính toán (OpenGL).

Trong VR/AR, occlusion handling nâng cao tính thực tế bằng cách che lồng vật thể ảo và thực, hỗ trợ tương tác tự nhiên. Khi người dùng di chuyển, hệ thống lập tức tính toán vùng che ảo để phủ đúng phần màn hình, tránh cảm giác “ma” (ghosting).

  • Occlusion culling giảm lần vẽ các đối tượng ẩn sau bề mặt khác.
  • Depth occlusion trong AR giúp vật thể ảo chui vào sau vật thật.
  • Hybrid rendering kết hợp ray tracing và rasterization để che khuất chính xác.

Ứng dụng trong xử lý ảnh y sinh

Trong y khoa, che khuất xuất hiện khi xương hoặc mô cứng cản trở tia X, làm mất thông tin mạch máu trong ảnh angiography. Kỹ thuật digital subtraction angiography (DSA) loại bỏ cấu trúc nền bằng cách trừ ảnh trước và sau tiêm thuốc cản quang (NCBI).

Trong siêu âm, mô mềm có thể che khuất cấu trúc sâu hơn, gây artifact shadowing. Giải pháp sử dụng beamforming và tissue harmonic imaging cải thiện khả năng xuyên thấu và tái tạo hình ảnh các cấu trúc bị che khuất (ASE).

Thách thức và giới hạn

Xác định che khuất chính xác trong cảnh phức tạp với nhiều vật thể là bài toán NP-hard. Sự đa dạng về hình dạng và vật liệu của vật thể làm cho việc mô hình hóa 3D và depth estimation gặp khó khăn.

Kết hợp đa nguồn dữ liệu (RGB, depth, thermal) giúp cải thiện độ chính xác nhưng đòi hỏi đồng bộ cao về thời gian và không gian. Ngoài ra, xử lý thời gian thực trên thiết bị nhúng (mobile, AR glasses) còn hạn chế về tài nguyên tính toán và năng lượng.

  • Độ phức tạp tính toán cao cho cảnh nhiều vật thể.
  • Giới hạn sensor depth với ánh sáng yếu và bề mặt phản xạ thấp.
  • Yêu cầu đồng bộ và calibrate đa cảm biến.

Triển vọng nghiên cứu tương lai

Sự phát triển của LiDAR và time-of-flight camera cung cấp bản đồ độ sâu chính xác hơn trong thời gian thực, hứa hẹn cải thiện khả năng phát hiện che khuất (Intel RealSense).

Hybrid deep learning models kết hợp CNN và transformer sẽ xử lý đồng thời thông tin hình ảnh và chiều sâu, tự động phân đoạn và tái tạo vùng che. Các kiến trúc như Swin Transformer đã chứng minh ưu thế trong nhiều bài toán segmentation (arXiv).

Trong robotics và autonomous driving, real-time occlusion handling với SLAM và object permanence modeling giúp robot và xe tự hành nhận biết vật thể chuyển động ngay cả khi tạm thời mất dấu, nâng cao an toàn và hiệu quả vận hành.

Danh mục tài liệu tham khảo

  1. Szeliski, R. (2010). Computer Vision: Algorithms and Applications. Springer.
  2. Hartley, R., & Zisserman, A. (2004). Multiple View Geometry in Computer Vision. Cambridge University Press.
  3. OpenCV Documentation. “Depth Map and Stereo Matching”. Retrieved from https://docs.opencv.org/
  4. Geiger, A., Lenz, P., & Urtasun, R. (2012). “Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite”. CVPR.
  5. IEEE T-PAMI. “Image Inpainting Techniques: A Survey”. Retrieved from https://ieeexplore.ieee.org/document/8019402
  6. NCBI Bookshelf. “Digital Subtraction Angiography”. Retrieved from https://www.ncbi.nlm.nih.gov/books/NBK532249/
  7. ASE. “Tissue Harmonic Imaging”. American Society of Echocardiography, 2023. Retrieved from https://www.asecho.org/
  8. Intel RealSense. “RealSense Depth Camera”. Retrieved from https://www.intelrealsense.com/
  9. Liu, Z., et al. (2021). “Swin Transformer: Hierarchical Vision Transformer using Shifted Windows”. arXiv. Retrieved from https://arxiv.org/abs/2103.14030

Các bài báo, nghiên cứu, công bố khoa học về chủ đề che khuất:

Âm vị và Chính tả trong Nhận diện Từ Thị giác: Bằng chứng từ Việc Thúc đẩy Không phải Từ Bị Che khuất Dịch bởi AI
SAGE Publications - Tập 45 Số 3 - Trang 353-372 - 1992
Ba thí nghiệm quyết định từ vựng bằng tiếng Pháp đã nghiên cứu ảnh hưởng của các từ không tồn tại được trình bày ngắn gọn và bị che khuất đến độ trễ trong việc xác định các mục liên quan về âm vị và/hoặc chính tả. Tại độ dài trình bày 64 ms, các từ không tồn tại là các âm gần giống (pseudohomophones) với mục đã tạo ra hiệu ứng hỗ trợ so với các nhóm đối chứng theo chính tả, nhưng những từ...... hiện toàn bộ
Các yếu tố đóng góp vào việc đánh giá một cái chết tốt từ góc nhìn của các thành viên trong gia đình người đã khuất Dịch bởi AI
Psycho-Oncology - Tập 17 Số 6 - Trang 612-620 - 2008
Tóm tắtBối cảnh: Mặc dù việc đạt được một cái chết tốt là rất quan trọng tại Nhật Bản, nhưng chưa có nghiên cứu nào khám phá các yếu tố liên quan đến một cái chết tốt. Mục tiêu của nghiên cứu này là khám phá các yếu tố góp phần vào một cái chết tốt từ góc nhìn của các thành viên gia đình người đã khuất, bao gồm nhân khẩu học của bệnh nhân...... hiện toàn bộ
#cái chết #cái chết tốt #nhân khẩu học #điều trị #bệnh nhân #gia đình
Chính trị của tri thức, sự che khuất tri thức luận và tri thức quản lý và tổ chức Hồi giáo Dịch bởi AI
Organization - Tập 19 Số 2 - Trang 229-257 - 2012
Bài viết này lập luận rằng tri thức quản lý và tổ chức Hồi giáo (MOK) tương đối bị thiếu và thể hiện không đúng trong tài liệu hiện có. Kết luận này được đưa ra sau một cuộc khảo sát và phân tích tài liệu chi tiết, trong đó cũng xem xét một số thực tiễn đại diện cốt lõi được sử dụng để giải thích về Hồi giáo trong tài liệu: sự tồn tại của chủ nghĩa thiết yếu và chủ nghĩa phương Đông; khuyn...... hiện toàn bộ
Sư phạm chuyên ngành trong bối cảnh căng thẳng giữa việc học tập theo trình độ năng lực và giáo dục hòa nhập: Nỗ lực kết hợp hay hiện tượng che khuất? Dịch bởi AI
Springer Science and Business Media LLC - Tập 14 Số 1 - Trang 113-128 - 2021
Tóm tắtTrong 20 năm qua, các lĩnh vực sư phạm đã phải đối mặt với hai chuyển biến mẫu mực trung tâm: sự định hướng năng lực do PISA (2000) khởi xướng và việc thực hiện Công ước về quyền của người khuyết tật của Liên Hợp Quốc (2006/2009). Khi được truy ngược về nguồn gốc lịch sử, hai hướng tiếp cận này có mối quan hệ mâu thuẫn và tạo ra một không gian căng thẳng cho...... hiện toàn bộ
ẢNH HƯỞNG CỦA HIỆN TƯỢNG CHE KHUẤT ĐẾN PIN MẶT TRỜI VÀ GIẢI PHÁP
Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng - - Trang 26-29 - 2017
Hoạt động của pin mặt trời phụ thuộc rất nhiều vào điều kiện môi trường xung quanh như nhiệt độ, bức xạ và hiện tượng che khuất là nguyên nhân chính gây tổn thất công suất đầu ra của pin. Bài viết này nghiên cứu về sự ảnh hưởng của đi-ốt bypass đến đặc tính của pin khi xảy ra hiện tượng che khuất hoàn toàn và đề xuất các mô hình cấu hình đi-ốt bypass khác nhau để khắc phục và nâng cao hiệu suất ho...... hiện toàn bộ
#PSpice #PV #pin mặt trời #che khuất #chồng chéo #đi-ốtbypass
Đánh giá hiệu quả làm việc của các thuật toán bắt điểm công suất cực đại khi hệ thống pin mặt trời bị che khuất
Tạp chí Khoa học và Công nghệ - Đại học Đà Nẵng - - Trang 6-10 - 2020
Hiện nay, việc nghiên cứu về hệ thống năng lượng mặt trời đang tập trung vào việc nâng cao hiệu suất làm việc, tuổi thọ của tấm pin. Trong quá trình hoạt động, yếu tố ảnh hưởng nghiêm trọng đến hiệu suất làm việc, tuổi thọ đó là hiện tượng che khuất đang là chủ đề được quan tâm nghiên cứu nhiều hiện nay. Hệ thống pin quang điện có thể bị che khuất bởi các đám mây, tòa nhà, cây cối… làm đặc tính P-...... hiện toàn bộ
#Hệ thống pin quang điện #hiện tượng che khuất #đặc tính I-V #đặc tính P-V #công suất đầu ra
Nhận thức đường viền 2-D do hiện tượng che khuất động học Dịch bởi AI
Perception & Psychophysics - Tập 46 - Trang 49-55 - 1989
Hiện tượng che khuất động học, sự biến mất dần hoặc tích tụ các yếu tố kết cấu khi một bề mặt che phủ hoặc phơi bày bề mặt khác, đã được chứng minh là một nguồn thông tin quan trọng để xác định thứ tự chiều sâu. Trong nghiên cứu hiện tại, tầm quan trọng của thông tin này đối với việc nhận thức đường viền 2 chiều đã được kiểm tra. Trong Thí nghiệm 1, các đối tượng được yêu cầu phân biệt bốn hình dạ...... hiện toàn bộ
#che khuất động học #nhận thức đường viền #diễn giải chiều sâu #phân biệt hình dạng #mật độ kết cấu #tốc độ.
Một phương pháp nhận diện khuôn mặt bị che khuất dựa trên biến đổi động từ hình ảnh đến lớp sử dụng chỉ số tương đồng cấu trúc Dịch bởi AI
Springer Science and Business Media LLC - Tập 53 - Trang 28501-28519 - 2023
Nhận diện khuôn mặt trong các môi trường không kiểm soát là một vấn đề thách thức trong thị giác máy tính do sự che khuất, độ nghiêng và sự thay đổi ánh sáng. Trong khi các kỹ thuật học máy có thể giải quyết việc nhận diện khuôn mặt bị che khuất, chúng yêu cầu phải huấn luyện lại khi cập nhật hình ảnh trong bộ sưu tập. Kỹ thuật Biến đổi Hình ảnh đến Lớp Động (DICW) cung cấp khả năng nhận diện theo...... hiện toàn bộ
#nhận diện khuôn mặt #biến đổi động từ hình ảnh đến lớp #chỉ số tương đồng cấu trúc #che khuất #thị giác máy tính
Thiết kế chòm sao GPS ảnh hưởng đến các hiện tượng che khuất hình học trong khu vực châu Á - Thái Bình Dương Dịch bởi AI
Journal of Geodesy - Tập 89 - Trang 519-536 - 2015
Sự gia tăng nhu cầu về sự phân bố không gian và thời gian tốt hơn của dữ liệu che khuất sóng vô tuyến là động lực cho nhiều nghiên cứu mở rộng, xem xét cả số lượng vệ tinh GNSS/thiết bị thu tín hiệu hoặc các công cụ tối ưu hóa tốt hơn dẫn đến phân bố tốt hơn. Bài báo này đề cập đến vấn đề thiết kế một nhiệm vụ che khuất sóng vô tuyến chỉ dựa vào hệ thống định vị toàn cầu (GPS) với hiệu suất tối ưu...... hiện toàn bộ
#chòm sao GPS #che khuất sóng vô tuyến #khu vực châu Á - Thái Bình Dương #tối ưu hóa quỹ đạo #mô hình truyền động quỹ đạo
Hiện tượng ảnh hưởng của việc che khuất hình ảnh ở khỉ sau khi bị tổn thương vỏ não chỗ ngồi và vỏ não thái dương dưới Dịch bởi AI
Physiological Psychology - - 2013
Trong nghiên cứu này, chúng tôi đã khám phá liệu sự suy giảm khả năng phân biệt thị giác do tổn thương vùng vỏ não chỗ ngồi và vỏ não thái dương dưới ở khỉ có liên quan đến sự mất mát cảm nhận thị giác trong các điều kiện che khuất thị giác. Các đường cong che khuất theo phương ngược đã được thu thập cho hai con khỉ trước và sau khi có tổn thương ở thùy thái dương và cho một người bình thường. Khi...... hiện toàn bộ
#khỉ; tổn thương vỏ não; che khuất thị giác; phân biệt thị giác; học hỏi thị giác
Tổng số: 16   
  • 1
  • 2